Subspace Clustering für die Analyse von CGH Daten

نویسنده

  • Emmanuel Müller
چکیده

Durch Problemstellungen bei der Anwendung von traditionellen Clustering-Algorithmen auf hochdimensionalen Daten motiviert, wurde im Rahmen meiner Diplomarbeit ein neues algorithmisches Konzept zum effizienten Subspace Clustering entwickelt. Eine mögliche Anwendung dieses Konzeptes stellt die Analyse von CGH Daten dar. Durch Subspace Clustering ist es möglich, Gruppen von Patienten zu identifizieren, deren Genom charakteristische Veränderungen in bestimmten Abschnitten der DNA aufweist. Durch Analyse der so identifizierten Gruppen können Hinweise auf Zusammenhänge zwischen den charakteristischen Veränderungen und den Erkrankungen der Patienten erkannt werden. Zuordnung: Data Mining, Clustering, hochdimensionale Daten, Comparative Genomic Hybridization

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Subspace Sequence Clustering - Dataming zur Entscheidungsunterstützung in der Hydrologie

In einem bundesweiten Projekt wird aktuell an der Erfüllung der EU-Richtlinie 2000/60/EG [1] für Flußrenaturierung gearbeitet. Im Rahmen dieses Projektes wurden Daten über die Fließgewässer in NRW kartiert. Basierend auf diesen Daten beschäftigt sich das Lehrund Forschungsgebiet für Ingenieurhydrologie der RWTH Aachen (Univ.-Prof. Dr.-Ing. Heribert Nacken) mit dem Erstellen von Renaturierungsma...

متن کامل

Visual Analytics of Patterns in High-Dimensional Data

Due to the technological progress over the last decades, today’s scientific and commercial applications are capable of generating, storing, and processing, massive amounts of data sets. This influences the type of data generated, which in turn means that with each data entry di erent aspects are combined and stored into one common database. Often the describing attributes are numeric; we name d...

متن کامل

Unerlaubte Weitergabe von privaten Daten zwischen Android-AppsAnalyse eines Szenarios

Malware unter Android kann Zugriff auf private Daten eines Benutzers erlangen, ohne die entsprechenden Berechtigungen aufweisen zu können. Besonders das Zusammenspiel mehrerer Apps erschwert die Erkennung von Daten-Lecks und macht die Taint-Analyse zu einem aufwändigen Prozess. In dieser Arbeit wird ein Überblick über aktuell verfügbare Software für die Taintund KomponentenkommunikationsAnalyse...

متن کامل

Visualisierungstechniken zur Exploration und Analyse sehr großer Datenbanken

Unser Ansatz zur Exploration und Analyse sehr großer Datenbanken basiert auf neuartigen Visualisierungstechniken für multidimensionale Daten. Die prinzipielle Idee dabei ist die gleichzeitige Darstellung möglichst vieler Datenobjekte am Bildschirm, wobei jeder Datenwert durch ein Pixel des Bildschirms repräsentiert wird. Die Farbe des Pixels entspricht dem Abstand des jeweiligen Datenwertes zum...

متن کامل

Automatische Parameterbestimmung durch Gravitation in Subspace Clustering

Zusammenfassung Im Vergleich zu den traditionellen Clusteringverfahren ermöglicht Subspace Clustering die Suche nach Clustern in den Unterräumen (Subspaces) der Daten. Man unterscheidet zwei Hauptarten des Subspace-Clustering-Verfahrens: Top-Downund Bottom-Up-Verfahren. Die Algorithmen des Top-Down-Verfahrens verkleinern die Suchbereiche von hohen zu niedrigen Dimensionen. In dem Bottom-Up-Verf...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007